Scree Plot
Der gezeigte kumulative Scree-Plot stellt dar, wie viel Varianz durch die sukzessive Hinzunahme von Hauptkomponenten (Principal Components, PCs) in einer PCA erklärt wird. Man erkennt, dass die ersten 3 Hauptkomponenten ausreichen, um den Großteil der Varianz (>90 %) der Daten zu erfassen. Der Zugewinn von 2 auf 3 Komponenten ist jedoch gering, daher werden 2 und 3 Dimensionen betrachtet.
PCA
Im 2-dimensionalen PCA-Fall kann man bereits eine klare Separarierung der drei Treatments in der ersten Hauptkomponente (PC1) erkennen. Zusätzlich sind DMSO und Soratenib jeweils schön zusammen gruppiert. Einzig bei Trametinib ist kein deutlicher Cluster erkennbar, was auf eine höhere In-Sample Varianz hindeuten könnte.
Die dritte Hauptkomponente PC3 bringt für die Interpration im konkreten Fall keinen Zugewinn.
MDS
Die MDS (Multi-dimensional Scaling) bestätigt die bisherigen Beobachtungen.
t-SNE und UMAP
Da PCA und MDS nur lineare Abhängigkeiten berücksichtigen, werden noch zwei nicht-lineare Techniken verwendet: 1. t-SNE: t-distributed stochastic neighbor embedding for non-linear relationship analysis; bildet lokale Zusammenhänge gut ab 2. UMAP: Uniform Manifold Approximation and Projection, bildet lokale und globale Zusammenhänge gut ab
Mit beiden Techniken lassen sich Zusammenhängen auf generellen Mannigfaltigkeiten analysieren, dh. auch nicht-lineare.
Die t-SNE zeigt deutliche Cluster für alle drei Treatments und scheint, die In-Sample-Varianz von Trametinib gut zu berücksichtigen. Auch ist Trametinib näher bei DMSO angesiedelt und Sorafenib weiter weg, was auf einen deutlicheren Unterschied von Sorafenib im Vegleich mit den anderen beiden Treatments hindeutet.
In der UMAP liegen die Cluster deutlich weiter auseinander, jedoch ist auch hier eine deutliche Trennung in der Abstufung DMSO > Trametinib > Sorafenib erkennbar.
Fazit
Die Dimensionsreduktionsanalyse hat ergeben, dass die einzelnen Samples von DMSO, Trametnib und Sorafenib homogene Cluster bilden und daher für die weitere Analyse gut geeignet sind.